Datos, información y conocimiento

Introducción

Los sistemas basados en conocimiento se basan en los datos que se adquieren del entorno, para ello, estos datos se procesan para inferir conocimiento.

 

Gobierno del dato

Los datos son el centro de la actual producción de la industria en la que nos encontramos.

La eficiencia económica reside en obtener, transformar y compartir los datos de tal manera que aporten valor.

El gobierno del dato debe:

De esta manera, se logra mejorar la infraestructura, reduciendo gastos de operación y optimizando los procesos administrativos.

 

Jerarquía del conocimiento

La jerarquía del conocimiento suele representarse gráficamente por una pirámide, siendo los datos la base y el conocimiento la cima.

 

Jerarquia_conocimiento

Esquema de jerarquía del conocimiento.

 

Datos

Un dato puede definirse como un hecho concreto y discreto acerca de un evento.

Discreto significa que, es la unidad mínima que puede comunicarse o almacenarse.

Aunque el dato tiene su significado propio, es difícil entender el significado de un dato sin conocer su contexto.

Ejemplos:

 

Tipos de datos
Estructurados

Un dato estructurado tiene un formato establecido (orden, estructura, características especiales...).

Sus fuentes de generación son dos:

Los datos estructurados son de fácil manipulación e interpretación.

Ejemplos: Bases de datos relacionales, tablas, CSV...

 

No estructurados

Un dato no estructurado no tiene un formato específico y pueden estar almacenados en formatos variados como Word, PDF, imágenes, páginas web o correos electrónicos.

Sus fuentes de generación son dos:

Los datos no estructurados suelen tener mayor valor informacional, pero su manipulación e interpretación resulta más compleja.

 

Semiestructurados

Los datos semiestructurados resultan de la combinación de los datos estructurados y no estructurados.

Ejemplos: Una oferta de empleo, porque puede contener:

 

Oscuros

Los datos oscuros, son los datos que se utilizan con propósitos diferentes para los que originalmente se obtuvieron.

 

Abiertos

Los datos abiertos, son datos de acceso y disponibilidad libre, sin restricción o limitación de ningún tipo, por lo que pueden ser usados o distribuidos, las veces que sean necesarias, por cualquier persona que lo desee.

Los datos abiertos deben poseer cuatro características:

Los datos abiertos se centran en una gobernanza bajo principios éticos.

 

Metadatos

Los metadatos son datos que se usan para describir otros datos.

Clasificación:

 

Los metadatos:

 

Datos != Metadatos

 

La distinción entre datos y metadatos no es siempre clara y depende del punto de vista del usuario. Por ejemplo, el título de un libro es parte del propio libro y, por tanto, es un dato, pero también sirve para catalogarlo y, por ello, puede ser un metadato.

 

Grandes volúmenes de datos (Big Data)

El Big Data es la gestión especializada de datos masivos, también conocida como ciencia de los datos.

El Big Data no solo se centra en el estudio de gran cantidad de datos, sino también en la gran variedad de los datos.

Para inferir conocimiento se utilizan herramientas estadísticas e informáticas para la agrupación y el análisis de los datos.

El Big Data va a encontrar patrones a través del análisis de comportamientos y afinidades de diferentes grupos de datos, permitiendo generar estrategias y acciones centradas en los mismos.

 

Información

La información puede entenderse como un conjunto de datos provisto de una relación semántica entre ellos, de tal forma que pasen a tener un significado. Es decir, los datos, por si solos, no tienen sentido.

 

datos + significado = información

 

Aunque pose un significado, no tiene porque ser útil.

Ejemplos:

 

Conocimiento

El conocimiento se construye a partir de la información y debe tener cierta utilidad o aportar algún tipo de valor.

Aunque el conocimiento se construye a partir de la información, más información no necesariamente generará más conocimiento.

 

Información + (su) aplicación = Conocimiento

 

El conocimiento se basa en la experiencia.

Los primeros sistemas basados en conocimiento se conocen como sistemas expertos.

 

Proceso de datos != Proceso de información != Proceso de conocimiento
ERROR en los datos ➔ ERROR en el conocimiento

 

Seguridad de los datos

La seguridad de los datos debe ser manejada de manera integral y completa durante todo el ciclo de vida del dato, abarcando los procesos de:

Los procedimientos de seguridad de los datos deben ser dinámicos, adaptables y configurables en el tiempo.

La integridad de los datos está orientada al:

 

Calidad de los datos

La calidad de los datos es el conjunto de propiedades inherentes a los datos a través de las cuales pueden ser valorados o juzgados, dado que datos de baja calidad representan una afectación grave en la calidad de la información para la toma de decisiones.

Se consideran datos de calidad aquellos que satisfacen los requerimientos previstos para su uso y que, además, presentan:

 

Información y conocimiento

Describíamos en apartados anteriores que, la información puede entenderse como un conjunto de datos provisto de una relación semántica entre ellos, de tal forma que pasen a tener un significado. Además, el conocimiento se construye a partir de la información y debe tener cierta utilidad o aportar algún tipo de valor.

 

Tenemos unos datos y su significado, que unidos a un contexto nos dan la información.

Interpretando esa información, obtenemos nueva información, que es lo que conocemos como conocimiento.

El conocimieto se construye a partir de información, tiene una carga de subjetividad, es una capacidad humana y está basado en la experiencia.
Informacion_conocimiento

 

Desde un punto de vista filosofal, para que la información se transforme en conocimiento es necesario que ésta sea asimilada por un sujeto.

 

Conocer es una combinación de experiencias (base de conocimiento), información contextual y relevancia de la información (calidad).

La comparación de información existente con la nueva información obtenida nos permite inferir modelos de comportamiento.

La generación de conocimiento surge a partir de REGLAS DE INFERENCIA.

De la mano de los expertos del dominio, y mediante técnicas lógicas, proporcionar unas reglas de inferencia (ontologías) que permitan cuantificar existencialmente la notación del conocimiento.

Su representación en sistemas computacionales se puede realizar a través de: Tripletas de objeto-atributo-valor, hechos inciertos, hechos difusos, mapas conceptuales, marcos, reglas, y ontologías

 

by Jose Manuel Pinillos